1
连接概率与数据的桥梁
AI014Lesson 5
00:00

将原始观测值转化为结构化的 R 对象 是进行概率分析所必需的技术流程。在建模分布之前,我们必须掌握 数据摄入 以及列表、矩阵和数据框之间的结构细微差别。

1. 结构化摄入

通过 scan() 通常需要一个 虚拟列表结构 来定义变量类型(例如, list(id="", x=0))。这可以确保来自如 input.dat 等文件的外部数据被解析为可管理的组件,而不是扁平向量。

2. 维度组织

虽然 matrix 用于同质数值集合(使用 byrow=TRUE),而 data.frame() 则是统计建模的决定性桥梁,允许异构数据类型共存。

原始文件列表 / 矩阵概率分布

3. 变量可访问性

为了进行推断而访问数据,涉及通过索引方式 inp[[1]] 或命名列如 inp$id。像 attach() 这样的函数允许在 整个对象 (如 eruptions)中的变量可以直接访问,而无需重复索引。

main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>